👌 Как правильно инициализировать центроиды в k-means, чтобы не застрять в плохом локальном минимуме
Простая случайная инициализация (выбор k случайных точек из данных) может привести к плохому результату, особенно если точки окажутся слишком близко друг к другу или не отражают структуру данных.
🔥 Лучшее решение — использовать алгоритм k-means++
Он работает так: 1. Сначала выбирается одна случайная точка из данных. 2. Далее каждый следующий центр выбирается с вероятностью, пропорциональной квадрату расстояния до ближайшего уже выбранного центра.
Такой подход равномерно распределяет центры и уменьшает риск плохой сходимости. В большинстве случаев он ещё и ускоряет обучение.
💡В сложных случаях (например, потоковые данные или неустойчивое распределение) можно использовать: — Инициализацию на основе иерархической кластеризации. — Несколько прогонов с разными начальными условиями и выбор лучшего результата по ошибке.
👌 Как правильно инициализировать центроиды в k-means, чтобы не застрять в плохом локальном минимуме
Простая случайная инициализация (выбор k случайных точек из данных) может привести к плохому результату, особенно если точки окажутся слишком близко друг к другу или не отражают структуру данных.
🔥 Лучшее решение — использовать алгоритм k-means++
Он работает так: 1. Сначала выбирается одна случайная точка из данных. 2. Далее каждый следующий центр выбирается с вероятностью, пропорциональной квадрату расстояния до ближайшего уже выбранного центра.
Такой подход равномерно распределяет центры и уменьшает риск плохой сходимости. В большинстве случаев он ещё и ускоряет обучение.
💡В сложных случаях (например, потоковые данные или неустойчивое распределение) можно использовать: — Инициализацию на основе иерархической кластеризации. — Несколько прогонов с разными начальными условиями и выбор лучшего результата по ошибке.
With the help of the Search Filters option, users can now filter search results by type. They can do that by using the new tabs: Media, Links, Files and others. Searches can be done based on the particular time period like by typing in the date or even “Yesterday”. If users type in the name of a person, group, channel or bot, an extra filter will be applied to the searches.
The seemingly negative pandemic effects and resource/product shortages are encouraging and allowing organizations to innovate and change.The news of cash-rich organizations getting ready for the post-Covid growth economy is a sign of more than capital spending plans. Cash provides a cushion for risk-taking and a tool for growth.
Библиотека собеса по Data Science | вопросы с собеседований from vn